Sélection de variables en apprentissage d'ordonnancement. Évaluation des SVM pondérés
نویسندگان
چکیده
RÉSUMÉ. Sélectionner les caractéristiques les plus utiles et les moins redondantes au sein des fonctions d’ordonnancement et réduire les temps d’exécution sont des enjeux en apprentissage d’ordonnancement. Les algorithmes de sélection de variables basés sur les SVM régularisés sont des approches prometteuses dans ce cadre. Dans cet article, nous proposons de nouvelles méthodes de sélection de variables en apprentissage d’ordonnancement basées sur des approches de pondération des SVM en norme `2. Nous proposons une adaptation d’une méthode `2-AROM qui résout des SVM en norme `0 et un algorithme de pondération de la norme `2 qui résout les problèmes en norme `0 et `1. Nos évaluations sur des jeux de données industriels et de référence montrent que les méthodes proposées sont jusqu’à 7 fois plus rapides et 10 fois plus parcimonieuses que l’état de l’art, pour des qualités d’ordonnancement équivalentes.
منابع مشابه
Séparateurs à Vaste Marge pondérés en norme L2 pour la sélection de variables en apprentissage d'ordonnancement
Learning to rank algorithms are dealing with a very large amount of features to automatically learn ranking functions, which leads to an increase of both the computational cost and the number of noisy redundant features. Feature selection is seen as a promising way to address these issues. In this paper, we propose new feature selection algorithms for learning to rank based on reweighted `2 SVM...
متن کاملSélection topologique de variables dans un contexte de discrimination
Résumé. En apprentissage automatique, la présence d’un grand nombre de variables explicatives conduit à une plus grande complexité des algorithmes et à une forte dégradation des performances des modèles de prédiction. Pour cela, une sélection d’un sous-ensemble optimal discriminant de ces variables s’avère nécessaire. Dans cet article, une approche topologique est proposée pour la sélection de ...
متن کاملApprentissage de fonctions d'ordonnancement par classification de paires ordonnées et pondérées (OWPC)
RÉSUMÉ. Apprendre les fonctions d’ordonnancement pour les moteurs de recherche est une tâche difficile parce que les critères d’évaluations généralement utilisés sont difficilement optimisables directement. Dans ce cas, nous sommes contraints d’optimiser une fonction d’erreur d’ordonnancement qui en est proche. Dans ce papier, nous proposons de définir une fonction d’erreur d’ordonnancement en ...
متن کاملMéthodologie de sélection de caractéristiques pour la classification d'images satellitaires
Résumé : Choisir les descripteurs d’une image en vue de son indexation n’est pas aisé, du fait de la variété des choix présentés dans la littérature. Nous développons à cet effet une méthodologie permettant de comparer différents ensembles de caractéristiques extraits d’une même base d’images. Cette méthodologie repose sur des algorithmes supervisés et non supervisés de sélection de caractérist...
متن کاملUne approche filtre pour la sélection de variables en apprentissage non supervisé
Résumé. La Sélection de Variable (SV) constitue une technique efficace pour réduire la dimension des espaces d’apprentissage et s’avère être une méthode essentielle pour le pré-traitement de données afin de supprimer les variables bruitées et/ou inutiles. Peu de méthodes de SV ont été proposées dans le cadre de l’apprentissage non supervisé, et, la plupart d’entre elles, sont des méthodes dites...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- Document Numérique
دوره 18 شماره
صفحات -
تاریخ انتشار 2015